'Bố già AI' tại Meta ca ngợi DeepSeek của Trung Quốc
Yann LeCun, Giám đốc khoa học AI của Meta, nhận định rằng thành công của DeepSeek ở Trung Quốc cho thấy mô hình AI mã nguồn mở đang vượt trội hơn các sản phẩm độc quyền. Ông nhấn mạnh rằng bài học lớn nhất từ thành công này không phải là áp lực cạnh tranh từ Trung Quốc, mà là tầm quan trọng của việc duy trì các mô hình AI dưới dạng mã nguồn mở để mọi người có thể được hưởng lợi.
Ông cho rằng vấn đề không phải là AI Trung Quốc vượt qua Mỹ, mà là các mô hình mã nguồn mở đang vượt trội hơn các mô hình độc quyền. DeepSeek R1 sử dụng mã nguồn mở tương tự như Llama của Meta. Mặc dù OpenAI được thành lập để phát triển công nghệ phục vụ nhân loại, nhưng gần đây đã chuyển từ mô hình nguồn mở sang nguồn đóng. LeCun cho biết DeepSeek đã tận dụng lợi ích từ nghiên cứu mở, phát triển ý tưởng mới dựa trên công trình của người khác.
Công trình của họ được công bố và dựa trên mã nguồn mở, giúp mọi người cùng hưởng lợi. Đó là sức mạnh của nghiên cứu mở và mã nguồn mở, ông Yann Lecun, Giám đốc khoa học AI của Meta, chia sẻ với sinh viên tại Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, tháng 12/2024. CEO Meta, Mark Zuckerberg, cũng ủng hộ mạnh mẽ mô hình mã nguồn mở, với mục tiêu trong 10-15 năm tới là xây dựng nền tảng mở và giúp chúng thành công.
Tôi nghĩ điều này sẽ làm cho ngành công nghệ trở nên sôi động hơn, ông nói vào tháng 9 năm 2024. Những người ủng hộ mã nguồn mở cho rằng nó giúp công nghệ phát triển nhanh chóng do ai cũng có thể chỉnh sửa và phân phối mã nguồn. Ngược lại, những người ủng hộ mã nguồn đóng cho rằng chúng an toàn hơn vì được bảo mật và khó chỉnh sửa. Cuối tháng 12 năm 2024, DeepSeek gây bất ngờ khi công bố mô hình ngôn ngữ lớn LLM DeepSeek V3 miễn phí.
Mặc dù còn một số vấn đề về phản hồi, mô hình được đánh giá cao vì chỉ mất hai tháng để phát triển với chi phí dưới 6 triệu USD, sử dụng GPU H800 bị giảm hiệu năng theo lệnh cấm của Mỹ, thay vì sử dụng các chip AI mạnh nhất. Trong các bài kiểm tra chuẩn của bên thứ ba, mô hình của DeepSeek đã vượt qua Llama 3.1 của Meta, GPT-4o của OpenAI và Claude Sonnet 3.
Mô hình V3 của Anthropic có độ chính xác cao trong giải quyết vấn đề phức tạp, toán học và mã hóa, vượt qua đối thủ trên bài kiểm tra Aider Polyglot. Theo DeepSeek, nó được đào tạo trên 14,8 nghìn tỷ token với 671 tỷ tham số, lớn hơn 1,6 lần so với Llama 3.1 405B. Logo ứng dụng DeepSeek xuất hiện trên điện thoại vào ngày 271.
DeepSeek vừa ra mắt mô hình AI mới mang tên DeepSeek R1, có khả năng lý luận và đã có mã nguồn mở trên Github. Nhiều đánh giá cho rằng DeepSeek R1 vượt trội hơn so với o1 mới nhất của OpenAI trong nhiều bài kiểm tra. Mô hình này có chi phí chỉ 2,19 USD cho một triệu token đầu ra, rẻ hơn 96,4% so với 60 USD của OpenAI o1, theo thông tin từ Giám đốc sản phẩm Shubham Saboo.
Yann Lecun, cùng với Geoffrey Hinton và Yoshua Bengio, được coi là "bố già AI". Ông là một trong những người tiên phong trong lĩnh vực AI hiện đại và nổi tiếng với quan điểm không tin rằng trí tuệ nhân tạo sẽ thống trị thế giới, trái ngược với quan điểm của Elon Musk.
Nguồn:vnexpress.net/bo-gia-ai-tai-meta-ca-ngoi-deepseek-cua-trung-quoc-4843807.html